预测器重要性是经典和量子机学习(QML)数据预处理管道的关键部分。这项工作介绍了此类研究的第一个研究,其中探索了对QML模型的重要性与其经典的机器学习(CML)等效物进行了对比。我们开发了一种混合量子式体系结构,其中训练了QML模型,并根据现实世界数据集上的经典算法计算特征重要性值。该体系结构已在ESPN幻想足球数据上使用Qiskit StateSvector模拟器和IBM量子硬件(例如IBMQ Mumbai和IBMQ Montreal Systems)实现。即使我们处于嘈杂的中间量子量子(NISQ)时代,物理量子计算结果还是有希望的。为了促进当前量子标尺,我们创建了一个数据分层,模型聚合和新颖的验证方法。值得注意的是,与经典模型相比,量子模型的特征重要性具有更高的变化。我们可以证明等效QML和CML模型通过多样性测量是互补的。 QML和CML之间的多样性表明,两种方法都可以以不同的方式促进解决方案。在本文中,我们关注量子支持向量分类器(QSVC),变分量子电路(VQC)及其经典对应物。 ESPN和IBM幻想足球贸易助理将高级统计分析与沃森发现的自然语言处理相结合,以提供公平的个性化贸易建议。在这里,已经考虑了每个播放器的播放器评估数据,并且可以扩展此工作以计算其他QML模型(例如Quantum Boltzmann机器)的特征重要性。
translated by 谷歌翻译
样式是自然语言文本的重要组成部分,反映了文本语调的变化,同时保持基础信息相同。即使编程语言具有严格的语法规则,它们也具有风格。代码可以使用相同的功能编写,但使用不同的语言功能。但是,编程样式很难量化,因此,作为这项工作的一部分,我们定义了专门针对Python的样式属性。为了构建样式的定义,我们利用层次聚类来捕获样式定义,而无需指定转换。除了定义样式外,我们还探索了预训练的代码语言模型的功能,以捕获有关代码样式的信息。为此,我们微调了预训练的代码语言模型,并在代码样式转移任务中评估了其性能。
translated by 谷歌翻译
类似于开放数据计划,数据科学作为社区,不仅启动了分享的举措,而且不仅可以分享整个管道,衍生物,文物等(开放数据科学)。但是,在如何促进分享,转换等方面存在的少数努力。此视觉纸张进一步逐步并提出Kek,这是一个不仅允许共享数据科学管道和共享数据科学管道的开放联合数据科学平台他们的(META)数据还提供了有效搜索的方法,并且在理想情况下,甚至允许以联合方式跨平台组合和定义管道。在这样做时,Kek解决了到目前为止忽视的忽视挑战实际上发现了语义相关的文物,可以组合以实现某个目标。
translated by 谷歌翻译
Automl系统通过对有效的数据转换和学习者进行搜索以及为每个学习者进行超参数优化,从而自动构建机器学习模型。许多汽车系统使用元学习来指导搜索最佳管道。在这项工作中,我们提出了一个名为KGPIP的新颖的元学习系统,(1)通过通过程序分析挖掘数千个脚本来构建数据集和相应管道数据库,(2)使用数据集嵌入式来在数据库中找到基于数据库的类似数据集(3)在其内容上而不是基于元数据的功能上,模型Automl Pipeline创建作为图形生成问题,以简洁地表征单个数据集看到的各种管道。 KGPIP的元学习是汽车系统的子组件。我们通过将KGPIP与两个自动系统集成在一起来证明这一点。我们使用126个数据集的全面评估,包括最先进的系统使用的数据集,这表明KGPIP明显优于这些系统。
translated by 谷歌翻译
3D卷积神经网络(3D CNN)在诸如视频序列之类的3D数据中捕获空间和时间信息。然而,由于卷积和汇集机制,信息损失似乎是不可避免的。为了改善3D CNN的视觉解释和分类,我们提出了两种方法; i)使用培训的3dresnext网络聚合到本地(全局 - 本地)离散梯度的层面全局,II)实施注意门控网络以提高动作识别的准确性。拟议的方法打算通过视觉归因,弱监督行动本地化和行动识别,显示各层在3D CNN中被称为全球局部关注的有用性。首先,使用关于最大预测类的BackPropagation培训3dresnext培训并应用于动作分类。然后将每层的梯度和激活取样。稍后,聚合用于产生更细致的注意力,指出了预测类输入视频的最关键部分。我们使用最终关注的轮廓阈值为最终的本地化。我们使用3DCAM使用细粒度的视觉解释来评估修剪视频中的空间和时间动作定位。实验结果表明,该拟议方法产生了丰富的视觉解释和歧视性的关注。此外,通过每个层上的注意栅格的动作识别产生比基线模型更好的分类结果。
translated by 谷歌翻译